Google демонстрира удивителна визия за това как AI ще работи с Gmail, Photos и други
Ден откакто OpenAI впечатли с удивително усъвършенстван ChatGPT AI модел, Гугъл сподели също толкоз зашеметяваща визия за това по какъв начин AI ще усъвършенства продуктите, които милиарди хора употребяват всеки ден.
Актуализациите, оповестени на годишната конференция за разработчици на Гугъл I/O, идват, когато компанията се пробва да надвиши главния си рекламен бизнес с нови устройства и принадлежности, задвижвани от AI. Изкуственият разсъдък беше преди всичко по време на събитието, основният изпълнителен шеф на Гугъл Сундар Пичай сподели в края на презентацията, че терминът „ AI “ е бил изречен 120 пъти – както е преброено от не какъв да е различен, а от неговата AI платформа Gemini.
По време на главната записка Гугъл сподели по какъв начин желае нейните AI артикули да станат по-голяма част от живота на потребителите, като да вземем за пример посредством шерване на информация, взаимоотношение с другите, намиране на предмети в къщата, правене на графици, извършване на покупки и потребление на устройство с Android. Гугъл всъщност желае неговият AI да бъде част от всичко, което вършиме.
Pichai даде началото на събитието, като акцентира разнообразни нови функционалности, задвижвани от най-новия AI модел Gemini 1.5 Pro. Една нова функционалност, наречена Ask Photos, разрешава на потребителите да търсят фотоси за по-задълбочени прозрения, като да вземем за пример да попитат по кое време щерка ви се е научила да плува или да си напомнят номера на вашия регистрационен номер, като преглеждат непокътнатите фотоси.
Той също по този начин сподели по какъв начин потребителите могат да изискат от Gemini 1.5 Pro да заключи всички скорошни имейли от учебното заведение на вашето дете, като проучва атачмънти и заключи основни точки и изплюе детайли за деяние.
Междувременно ръководителите на Гугъл се редуваха да показват други благоприятни условия, като да вземем за пример по какъв начин най-новият модел може да „ чете “ учебник и да го трансформира в нещо като AI лекция с естествено звучащи учители, които дават отговор на въпроси.
Само един ден преди този момент OpenAI – един от водачите в софтуерната промишленост в региона на изкуствения разсъдък – показа нов AI модел, който съгласно него ще направи чатбота ChatGPT по-умен и по-лесен за потребление. GPT-4o има за цел да трансформира ChatGPT в цифров персонален помощник, който може да взе участие в диалози в действително време, устни диалози и да взаимодейства благодарение на текст и „ визия “. Може да преглежда екранни фотоси, фотоси, документи или диаграми, качени от потребителите, и да води диалог за тях.
Гугъл също сподели най-новите качества на Gemini да приема разнообразни типове входни данни – „ мултимодални “ благоприятни условия за приемане на текст, глас или изображения – като пряк отговор на напъните на ChatGPT. Изпълнителен шеф на Гугъл също по този начин показва виртуален „ съотборник “, който може да ви помогне да останете на върха на описите със задания, да организирате данни и да управлявате работния развой.
Компанията също акцентира подобренията в търсенето, като разрешава на потребителите да задават по-естествени или по-фокусирани въпроси и дава разнообразни версии на отговорите, като задълбочени или систематизирани резултати. Може също по този начин да прави целеви оферти, като да вземем за пример препоръчване на подобаващи за деца заведения за хранене на избрани места, или да означи какво може да не е наред с прибавка, като камера, като снима видеоклип на казуса посредством Гугъл Lens. Целта е търсенето в Гугъл да бъде отстранено, споделиха от компанията.
Компанията също по този начин в резюме показа Project Astra, създаден от лабораторията DeepMind AI на Гугъл, който ще разреши на AI асистентите да оказват помощ в всекидневието на потребителите, като употребяват телефонни камери за интерпретиране на информация за действителния свят, като идентифициране на обекти и даже намиране на несъответствуващи предмети. Освен това загатна по какъв начин ще работи върху очила с добавена действителност.
Гугъл сподели, че по-късно тази година ще интегрира повече AI функционалности в телефоните. Например, потребителите ще могат да плъзгат и пускат изображения, основани от AI, в Гугъл Messages и Gmail и да задават въпроси по отношение на видеоклипове и PDF файлове в YouTube на устройство с Android.
И в ход, който евентуално ще се хареса на мнозина, нов вграден инструмент за Android ще помогне за разкриване на подозрителна интензивност по време на диалог, като да вземем за пример лъжец, който се пробва да имитира банка на консуматор.
Според анализатора Джейкъб Борн от компанията за пазарни изследвания Emarketer, не е изненада, че изкуственият разсъдък заема централно място на тазгодишната конференция за разработчици на Гугъл.
„ Като показва най-новите си модели и по какъв начин те ще зареждат съществуващите артикули със мощен обсег на потребителите, Гугъл показва по какъв начин може дейно да се разграничи от съперниците “, сподели той.
Той има вяра, че приемането на новите принадлежности ще бъде знак за това какъв брой добре Гугъл може да приспособява своя артикул за търсене, с цел да отговори на условията на генеративната AI епоха.
„ За да резервира конкурентното си преимущество и да задоволи вложителите, Гугъл ще би трябвало да се концентрира върху превръщането на своите AI нововъведения в печеливши артикули и услуги в мащаб “, сподели той.
Тъй като компанията усилва своя отпечатък от ИИ, тя сподели, че ще вкара повече отбрани, с цел да понижи евентуалната корист. Гугъл уголемява съществуващата си функционалност SynthID, с цел да открива наличие, генерирано от AI. Миналата година инструментът добави водни знаци към изображения и аудио, генерирани от AI.
Гугъл съобщи, че също си партнира с специалисти и институции, с цел да тества и усъвършенства опциите в новите си модели.
Въпреки че компанията удвои изкуствения разсъдък през последната година, тя също се сблъска със обилни спънки. Миналата година, малко след представянето на своя генеративен AI инструмент – тогава наименуван Bard и от този момент преименуван на Gemini – цената на акциите на Гугъл падна, откакто демонстрационен видеоклип на инструмента сподели, че дава в действителност неакуратен отговор на въпрос за галактическия телескоп James Webb.
Съвсем неотдавна компанията прекъсна през февруари способността на Gemini да генерира изображения на хора, откакто беше разкритикувана в обществените медии за основаване на исторически неточни изображения, които значително демонстрират цветнокожи вместо бели хора.
Gemini, сходно на други AI принадлежности като ChatGPT, се образова въз основата на голямо количество онлайн данни. Експертите от дълго време предизвестяват за минусите към AI инструментите, като капацитета за грешки, пристрастия и разпространяването на дезинформация. Въпреки това, доста компании напредват с принадлежности или партньорства с изкуствен интелект.
Apple може да се интересува от лицензиране и създаване на Gemini AI мотора на Гугъл, който включва chatbots и други AI принадлежности, в идните iPhones и неговите iOS 18 функционалности, заяви Bloomberg през март. Съобщава се също, че компанията беседва със основателя на ChatGPT OpenAI.